Teoria dos Jogos 


Profa. Marislei Nishijima 


O que estudamos nas aulas anteriores 


mesmo? “4 


Estruturas de Mercados 


Mercados Competitivos 
Monopólio e Monopsônio 
Competição Monopolisitica 
Oligopólio — teoria clássica da interação estratégica 
m Liderança de Preço e de Quantidade (Modelo de Stackelberg — 
1934) 


= Estabelecimento simultâneo da quantidade, a partir da expectativa 
de produção das demais empresas (Modelo de Cournot — 1838) 


= Estabelecimento simultâneo do preço, a partir da expectativa de 
produção das demais empresas (Modelo de Bertrand — 1888) 


= Cartéis. 


Objetivos = 


* Continuamos a estudar o comportamento 
de interação estratégica, tal qual 
verificado na estrutura oligopolista, agora 
no ambito da teoria dos jogos: 

— Ramos da Teoria dos Jogos 
— Jogos não-cooperativos. 

* Conceitos básicos. 

* Dominância. 

* Dilema dos Prisioneiros. 

* Batalha dos Sexos. 

* Equilibrio de Nash. 


Desenvolvimento da TJ 


*- Pontos de referência na linha do tempo: 


a Anos 50 > 
Nascimento da TJ É 
Precursores ER o > desenvolvimento 


E: conhecimento intenso da TJ 
Waldegrave E: 
(1713): primeira John von Neumann « Primeira discussão do 
discussão publicou uma série de Dilema dos Prisioneiros 


conhecida sobre papers em 1928 > “The (RAND Corp.). 
“TJ”, propondo uma Theory of Games and 


bs e E E e Nash desenvolveu 
solução estratégica Economic Behavior”, 


definição de estratégia 


o dicidad EP am ótima para jogos com 
, a RR muitos jogadores — 
Cournot (1838): ótimas para jogos de Equilíbrio de Nash > 


“Versão restrita” do Soma zero; Jogos jogos cooperativos e 


equilíbrio de Nash. cooperativos não-cooperativos. , 


Desenvolvimento da TJ ” 


*- Pontos de referência na linha do tempo: 


Anos 70 e demais E) Prêmios Nobeis 


Anos 60 


! 


Selten (1965): 
refinou ainda mais o 
Equilíbrio de Nash, 
introduzindo o 
conceito de solução 
de equilíbrio perfeito 
de subjogo; 


Harsanyi (1967): 
desenvolveu os 
conceitos de jogos 
Bayesianos e de 
informação completa. 


b 


Tj amplamente aplicada 
à biologia, como 
resultado do trabalho 
de J. M. Smith e sua 
estratégia estável 
evolucionária. 
Aplicações à psicologia 
e sociologia. 


Anos 90 > estrutura de 
leilões. 


! 


e 1994 — Nash, Selten e 
Harsanyi 


e 2005 — Schelling e 
Aumann. 


Cooperativo X Não-cooperativo 


- Os jogos cooperativos (ou de coalizão) têm como unidade 
fundamental de análise grupos e sub-grupos de indivíduos 
que são assumidos serem capazes de alcançar um resultado 
particular por meio do comprometimento com acordos de 
cooperação (contratos). Descreve apenas os ganhos de cada 
grupo, sem explicitar o processo que leva à formação da 
coalizão. 


— =) teoria de equilibrio geral: core; 


— =) situações naturais em ciência política ou relações 
internacionais, em que conceitos como poder são 
relevantes. 


Cooperativo X Não-cooperativo 


- Os jogos não-cooperativos, dos quais trataremos, lidam 
com a interdependência estratégica, em que não há o 
comprometimento por meio de acordos > modelos 
explicitamente descrevem o processo por meio do qual os 
agentes fazem suas escolhas. 


— OBS: Não significa que o comportamento de cooperação não 
possa ser explicado, mas que ele deve ser o resultado da 
busca do interesse próprio de cada participante!! 


Conceitos Básicos - 1 


O que é a Teoria dos Jogos não-cooperativos? 


Instrumental para a análise de interação estratégica entre agentes 
econômicos, estudando formalmente o conflito e a cooperação. 


Jogo: situação em que os jogadores (participantes) tomam 
decisões estratégicas levando em conta uns as decisões dos 
outros. 
Formalização: os modelos são expressões precisas de 
idéias » verbal ou matemática (mais concisa e precisa) 

— O conjunto de jogadores; 

— Para cada jogador, um conjunto de ações; 

— Para cada jogador, as preferências sobre o conjunto de ações. 


Conceitos Básicos - 2 


- Estratégia: conjunto ou plano de ações 
contingentes ou regras do jogo. 


- Payoff: um número que reflete a 
desejabilidade de um resultado possivel 
para um jogador, ou seja, expressa suas 
preferências (utilidade). 


- Estratégia ótima: estratégia que 
maximiza o payoff esperado do jogador. 


Jogos Não-Cooperativos 


- 1. Hipótese: Os jogadores são racionais 


— Sempre escolhem uma ação que gera o resultado preferido, 
dado o que ele espera que seus oponentes farão; 


— Obs. Pode ser relaxada, porém a análise se torna 
experimental. 


* 2. Objetivo: 


— Predizer como o jogo será jogado por jogadores racionais ou 
qual a melhor maneira de jogar contra oponentes racionais. 


Jogos Não-Cooperativos - Formas 


- Forma Estratégica (forma normal): tipo básico, lista as 
estratégias de cada jogador e os resultados (payoffs) de cada 
possível combinação de escolhas. 

— Ex. JNC com 2 jogadores X e Y pode ser representado por uma 
matriz de payoffs associados aos resultados possíveis para X 
(xi ex2) e para Y (yl ou y2): 


Tr fere Py1,Px1 | Py1,Px2 





Py2,Px1 | Py2,Px2 


Jogos Não-Cooperativos - Formas 


- Forma Extensiva (jogo em árvore): forma mais 
detalhada; descrição completa de como o jogo é jogado 
ao longo do tempo — quem se move e quando; que ações 
cada jogador pode tomar; o que cada jogador sabe 
quando se move, quais resultados são funções de quais 
ações tomada pelos jogadores e os payoffs de cada 
jogadores em cada resultado possível. 


— Jogos sequências. 


Jogador X 





Dominância 


* Em certos tipos de JNC, uma estratégia específica para um 
dos jogadores pode sempre levar ao melhor payoff, para 
qualquer combinação de estratégias dos outros jogadores > 
estratégia dominante (ou auto-implementável ou 
estável). 


* Um agente racional sempre escolherá uma estratégia 
dominante. 


- Se cada jogador tem uma estratégia dominante > equilíbrio 
de estratégias dominantes. 


— Dilema dos Prisioneiros 


Estratégias Dominantes 


* Estratégia Dominante (Resumindo) 


— É uma estratégia ótima para um jogador 
independentemente do que seu oponente possa 
fazer. 


Matriz de Payojf para o jogo da propaganda com 


estratégia dominante 


Empresa B .. 
Não faz 


Faz propaganda propaganda 


Faz propaganda 


Empresa A 


Não faz 
propaganda 


Estratégias Dominantes 


* Jogo Sem Estratégias Dominantes 


— A decisão ótima de um jogador que não possua 
uma estratégia dominante depende das ações do 
outro jogador. 


Jogo da Propaganda Modificado 
Empresa B Não faz 


Faz propaganda propaganda 


Faz propaganda 


Empresa A 


Não faz 
propaganda 


Jogo da Propaganda Modificado 


- Observações Empresa B | 
— A não tem uma Faz , a 
estratégia dominante; propaganda 


sua decisão depende 
das ações de B Faz 
— Para B, a decisão ótima Propaganda 
é fazer propaganda 
* Pergunta Não faz 


— O que 4 deveria fazer? propaganda 
(Dica: pense na decisão 
de B) 


Empresa A 





Equilíbrio de Estratégia Dominante é um exemplo 
de Equilibrio de Nash 


* Estratégias Dominantes 


— “Estou fazendo o melhor que posso, 
independentemente do que você esteja fazendo. ” 


— “Você está fazendo o melhor que pode, 
independentemente do que eu esteja fazendo. ” 


Equilíbrio de Nash 


* Equilíbrio de Nash 


— “Estou fazendo o melhor que posso, dado o que 
você está fazendo ” 


— “Você está fazendo o melhor que pode, dado o 
que eu estou fazendo. ” 


Equilíbrio de Nash 


Problema da Escolha do Produto 


* Exemplos de Equilíbrio de Nash 
— Dois fabricantes de cereais matinais 


— O mercado de cereais crocantes admite apenas um 
produtor 


— O mercado de cereais açucarados admite apenas um 
produtor 


— Cada empresa dispõe de recursos suficientes para 
lançar apenas um produto 


— Trata-se de um jogo não-cooperativo 


Problema da Escolha do Produto 


Empresa 2 


Crocante Açucarado 


Crocante 


Empresa 1 


Açucarado 


Problema da Escolha do Produto 


* 2 equilíbrios de 
Nash 


Empresa 2 


Crocante Açucarado 


Crocante 


Empresa 1 


Açucarado 





Jogo de Localização na Praia 


e Situação 
— Dois concorrentes, Y e C, vendem refrigerantes 
— Local: praia com 200 jardas de comprimento 


— Os banhistas encontram-se distribuídos 
uniformemente pela praia 


— Preço de Y = Preço de € 


— Cada cliente irá comprar do vendedor mais 
próximo 


Jogo de Localização na Praia 


Oceano 
C 
| | Iy | 1 
O B Praia A 200 jardas 


Onde os vendedores se localizarão (ou 
seja, qual é o equilibrio de Nash)? 


Jogo de Localização na Praia 


Oceano 
C 
ly 
0 B Praia A  200jardas 


2) Outros exemplos desse tipo de problema 
de decisão: 


— Localização de um posto de combustível 


— Eleições presidenciais 


Dilema dos Prisioneiros 


Prisioneiro B 
Confessa Não Confessa 


Confessa 


Prisioneiro A 
Não 
Confessa 


Dilema dos Prisioneiros 


e Qualéa: 
— Estratégia Prisioneiro B 
dominante”? Confessa Não Confessa 
— Equilíbrio de 
Nash”? 
— Solução de 
maximin? Prisioneiro A 


Confessa 


Não 
Confessa 





Batalha dos Sexos 


Situação: Duas pessoas desejam sair juntas, hã duas 
alternativas disponíveis, luta livre e ópera. Além disso, uma 
pessoa prefere luta livre, a outra, Ópera. 


Se forem juntas ao lugar da preferência de uma delas, esta 
terá maior felicidade. 


Se cada uma for a um lugar diferente daquele de sua 
preferência, mas na companhia da outra, ficará menos feliz. 


Se não estiverem juntas, cada uma fica igualmente infeliz. 


A Guerra dos Sexos 


Luta livre Ópera 


Luta livre 


Jim 


Ópera 


A Guerra dos Sexos 


* Estratégias Puras 
— Ambos vão à luta livre 
— Ambos vão à Ópera 


Joan 
Luta livre Ópera 


* Estratégias Mistas 


— Jim opta pela luta Luta livre 
livre com 
probabilidade 2/3 Sim 

— Joan opta pela luta ) 
livre com Opera 
probabilidade 1/3 





Equilibrio de Nash 
- Então: 


* Assim como o jogo batalha dos sexos mostrou que 
pode haver mais de um equilibrio de Nash, 
também é possível que não haja equilibrio de 
Nash algum. 

* Um equilibrio de Nash não conduz 
necessariamente a resultados eficientes de Pareto, 
como mostrou o dilema dos Prisioneiros. 


Equilíbrio de Nash 


* Estratégia Pura 


— O jogador faz uma escolha específica 


* Estratégia Mista 


— O jogador faz uma escolha aleatória entre duas 
ou mais ações possíveis, com base em um 
conjunto de probabilidades 





Curva de Melhor 


resposta 
Mr. Row 


A melhor escolha de row e column tem dependência 
mútua. Se cada um dos dois jogadores tivessem r,, r,,..rp 
e c,, C5,...Cc estratégias. Para cada escolha que row faz, 
b.(r) será a melhor resposta de column e para cada 
escolha de column, b.(c) será a melhor escolha de row. O 
equilíbrio de Nash será o par de estratégias (r*,c*) tal que 


c*=bo(r*) e rt*=b(c*). (idéia de consistência mútua) 

















Jogo de 
Estratégia Mista 


Ms. Column 


Seja r a probabilidade de row jogar top e (1-r) de jogar bottom, e c a probabilidade de 
column jogar left e (1-c) a de jogar right. Então, o payoff esperado de Row: 


Probabilidade Payoff de Row 


top, left rc 2 
botton, left (1-r)c 0 
top, right r(1-c) 0 
bottom, right (1-r)(1-c) 1 


Payoff de Row = 2rc+1(1-r)(1-c) 
Payoff de Row =2rc + 1 -r -c +rc 


Sendo o Payoff de Row =2rc + 1 -r -c+rc 


Imagine que Row pense em aumentar r de Ar, o que varia seu payoff de: 
2cAr —Ar +cAr 
(3c-1)Ar 


Para que (3c-1)Ar seja positivo, 3c-1>0 e c>1/3 
E será negativo quando c<1/3 


Então Row vai querer aumentar r quando c>1/3 e reduzir r quando c<1/3 e 
estará contente com qualquer valor der (entre 0 e 1) caso c=1/3. 


Seja r a probabilidade de row jogar top e (1-r) de jogar bottom, ec a 
probabilidade de column jogar left e (1-c) a de jogar right. Então, o payoff 


ee Probabilidade Payoff de Column 


top, left rc 1 
botton, left (1-r)c O 
top, right r(1-c) 0 
bottom, right (1-r)(1-c) 2 


Similarmente Payoff de Column = cr+2(1-r)(1-c) 

Se Column quiser aumentar c de Ac seu Payoff vai variar de: 
rÃc+2rAc-2ÃAc 

(3r-2)Ac 

Para que (3r-2)Ar seja positivo, 3r-2>0 e r>2/3 

E será negativo quando c<2/3 


Então Column vai querer aumentar c quando r>2/3 e reduzir c quando r<2/3 
e estará contente com qualquer valor de c (entre 0e 1) caso r=2v/3. 


Função 
melhor 
resposta 


Row's best 
response 


/ 


1/3 


Column's best 
response 


/ 


FIGURE 29.1 Best response curves 
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De volta ao jogo Batalha dos sexos, com mesmos 
payoffs do jogo anterior, cuja coordenação leva aos 
maiores payoffs (dificil é montar o esquema de 
incentivos para a coordenação). Tem-se 3 
equilíbrios de Nash: Todos vão ver filme de ação; 
todos vão ver filme de arte ou cada um escolhe seu 
preferido com 2/3 de probabilidade. 





Jogos Repetitivos 


* Conclusão: 
— Num jogo repetitivo: 

* O Dilema dos Prisioneiros pode ter uma solução 
cooperativa, onde cada jogador adota a estratégia tit- 
for-tat 

— Um resultado cooperativo é mais provável em mercados 
com as seguintes características: 

* Poucas empresas 

* Demanda estável 


*- Custos estáveis 
— A obtenção de um resultado cooperativo é difícil, pois os 
fatores mencionados estão sujeitos a mudanças no longo 
prazo. 


Jogos de coordenação 


Jogos de coordenação levam ao maior payoff se 
a cooperação puder ser induzida. Vimos que o 
Dilema dos Prisioneiros pode levar a cooperação 
se jogado repetidamente com número de 
jogadas desconhecidas. Outra forma de induzir 
melhora de ganhos seria montar esquemas de 
coordenação. Por exemplo, primeiro movimento 
no Jogo de Batalha dos Sexos. No caso de 
decisão de armamentos, a solução poderia ser 
assinatura de acordos mútuos. 


Jogos Sequenciais 


* Os jogadores tomam suas decisões um de 
cada vez 


* Cada jogador deve considerar todas as 
possíveis ações e reações racionais dos demais 


Jogos Sequenciais 


* Exemplos 


— Reação à campanha de propaganda de um 
concorrente 


— Decisões de entrada na indústria 
— Reação a políticas regulatórias 


Jogos Sequenciais 


Forma Extensiva de um Jogo 


*- Situação 

— Dois novos cereais matinais (crocantes/ açucarados) 
podem ser lançados no mercado 

— Os novos produtos só serão rentáveis se houver 
apenas um produtor de cada 

— As vendas dos cereais açucarados deverão superar as 
vendas dos crocantes (mas ambos serão rentáveis com 
apenas um produtor) 


Problema Modificado da Escolha de Produtos 


Empresa 2 


Crocante Açucarado 


Crocante 


Empresa 1 


Açucarado 


Problema Modificado da Escolha de Produtos 


Forma Extensiva de um Jogo 


* Suponha que a Empresa 1 lance o seu 
cereal antes da Empresa 2 (trata-se de um 
jogo sequencial). 

— Usando uma árvore de tomada de decisão 


* Trabalhe de trás para frente, a partir do melhor 
resultado para a Empresa 1 


Forma Extensiva do Jogo da Escolha do Produto 


Crocante 
Empresa 2 | 
rocantO-mam-um 
Açucarado 10, 20 


Crocante 20, 10 
AçucaradO-m-= Emp nz fo 
Açucarado -5, -5 


Empresa 1 


Jogos Sequenciais 


* A Vantagem em Ser o Primeiro 


— Nesse jogo de escolha do produto, ser o primeiro 
a se mover é claramente vantajoso. 


Ameaças, Compromissos, e Credibilidade 


* Movimentos Estratégicos 


— O que uma empresa pode fazer para 
conquistar uma posição vantajosa no 
mercado? 

* Impedir a entrada de novas empresas 


* Induzir as concorrentes a reduzir a produção, 
aumentar o preço ou abandonar o mercado 


* Estabelecer acordos implícitos com outras 
empresas 


Ameaças, Compromissos, e Credibilidade 


* Como fazer o primeiro movimento 
— Demonstrar compromisso 


— Empresa 1 deve restringir seu comportamento para 
convencer a Empresa 2 de que está compromissada com o 


acordo. 


* Ameaças Vazias 


— A ameaça de uma empresa reduzir seu preço não é crível, 
caso essa redução deva resultar em prejuízo para a 
empresa. 


Determinação do Preço de Computadores e de 
Processadores de Textos 


Empresa 2 
Preço Alto Preço Baixo 
Preço Alto 100, 80 80, 100 


Empresa 1 


Preço Baixo 


Determinação do Preço de Computadores e de 
Processadores de Textos 


* Pergunta 


— À Empresa 1 seria 
capaz de forçar a 
Empresa 2 a 
cobrar um preço preço Alto 
alto, através da 
ameaça de reduzir 
seu próprio Preço Baixo 
preço? 


Empresa 2 
Preço Alto Preço Baixo 





Empresa 1 


Desencorajamento à Entrada 


* Para impedir a entrada de novas empresas na 
indústria, a empresa estabelecida deve 
convencer as concorrentes potenciais de que 
sua entrada não será lucrativa. 


Possibilidades de Entrada 


Ingressante Potencial 


Entra Não entra 


Preço alto 
(acomodação) 


Empresa 
estabelecida 


Preço Baixo 
(guerra) 70, -10 


Desencorajamento à Entrada 


* Situação 

— oo monopolista estabelecido (/) e um entrante potencial 
X 

— Custo irreversível de X (para construir uma planta de 
produção) = S80 milhões 

- Se X não entra, | aufere um lucro de $200 milhões. 

- Se X entra e cobra um preço alto, | aufere um lucro de 
$100 milhões e X obtém S20 milhões. 


- Se X entra e cobra um preço baixo, | aufere um lucro de 
S70 milhões e X obtém S-10 milhões. 


Desencorajamento à Entrada 


A ameaça é crível 
* De que forma | pode impedir a entrada de X? 


1) Realização de investimento em capacidade 
adicional antes da entrada de X (compromisso 
irrevogável) 


2) Comportamento irracional 


cá a id 





Ingressante Potencial 


Entra Não entra 


Preço alto 
(acomodação) 


Empresa 
Estabelecida 


Preço Baixo 70, -10 


(guerra) 


Desencorajamento à Entrada 





* A ameaça de 
guerra de preço é 


crível 
, - Preço alto 
e Xoptara por não (acomodação) 
entrar Empresa 


Estabelecida 


Preço Baixo 
(guerra) 





Desencorajamento à Entrada 


* Airbus versus Boeing 
— A matriz de payoffs no caso em que a Airbus é 
subsidiada é muito diferente do caso em que a 
empresa não recebe subsídios. 


O Desenvolvimento de uma Nova Aeronave 
Airbus 


Produz Não produz 


Produz 
Boeing 


Não produz 


O Desenvolvimento de uma Nova Aeronave 


* Boeing decidirá 
produzir Airbus 


Produz Não produz 


e Airbus não 
produzirá radio 


Boeing 


Não produz 





Desenvolvimento da Aeronave após o Subsídio 
Europeu 


Airbus 


Produz Não produz 


Produz 
Boeing 


Não produz 


Desenvolvimento da Aeronave após o Subsídio 
Europeu 


e Airbus decidirá 
produzir 


Airbus 
Produz Não produz 


* Boeing não 
produzirá radios 


Boeing 


Não produz 










Se row chuta left com probabilidade p, seu valor 
esperado quando column defende left e right 
respectivamente serão: 


50p+90(1-p) e 80p+20(1-p) 


Column quer fazer estes valores serem máximos e 
column mínimos 





Jogo de Competição: 
Exemplo Jogo de Soma 
Zero. Não possui equilibrio 
de estratégia pura, mas 
possui de estratégia mista. 









64 







Se column defende esquerda com probabilidade q, o 
payoff de row quando chuta left e right respectivamente 
será: 

500+80(1-q) e 909+20(1-g) 

Row quer fazer estes valores serem máximos e column 
mínimos 





Jogo de Competição: 
Exemplo Jogo de Soma 
Zero. Não possui equilibrio 
de estratégia pura, mas 
possui de estratégia mista. 
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ROW'S 100 


PERCENT 
SUCCESS 9) 
80 
62 
50 
20 


O ado 1 


ROW'S PROBABILITY p 


E OF KICKING LEFT 
Estratégia de row. As duas curvas mostram o payoff 


esperado de row como função de p. A qualquer p 


que escolha, column vai tentar minimizar seu payoff. 
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50 


ROW'S 100 

PERCENT 

SUCCESS 90 
80 
7 . 


20 


O .6 1 


COLUMN'S PROBABILITY q 
OF JUMPING LEFT 


Estratégia de column. As duas curvas mostram o 
payoff esperado de row como função de q. A 


qualquer q que column escolha, row vai tentar Intermediate Microeconomics, 7th Edition 
maximiza r seu payoff Copyright O 2006 W. W. Norton & Company 











Estratégias de equilíbrio 


Row deve chutar left com probabilidade p=0.7 
Column deve defender left com probabilidade p=0.6 


Obtidos por: 50p+90(1-p) = 80p+20(1-p) 
E 5009+80(1-q) = 909+20(1-g) 


Column's best 
response 


/ 


Row's best 
response 
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